查看原文
其他

再创丨基因组DNA单碱基编辑技术与工具开发

孟凡康 再创丨Regenesis 2021-02-09

编者的话·写在前面

前言:人类遗传疾病大多数都是由单个碱基或者少数几个碱基突变导致的,基因编辑技术CRISPR/Cas9的出现为治愈这些疾病带来了曙光。然而现有的基因组编辑技术编辑效率仍然处于较低的水平,对于不同的细胞类型或者状态编辑效果差别较大。同时,CRISPR/Cas9技术在对靶点DNA进行编辑时会引入DNA双链断裂(DSB, Double-strand Breaks),诱发细胞DNA修复机制,这往往会导致DNA靶点出现碱基随机插入或者缺失,大大降低基因编辑的效果。为了解决这一问题,哈佛大学David Liu团队通过一系列工作开发了新型的基因组编辑技术:DNA单碱基编辑技术。这项技术有望解决CRISPR/Cas9技术存在的诸多弊端,为人类遗传疾病带来新的解决方案。


作者:孟凡康

校对:邓婷月 罗训训 孙智 张益豪

全文约8000字,阅读时间约为15分钟


Hertz Nazaire

Hertz Nazaire是一名艺术家,说话慢条斯理,喜欢用鲜艳的色彩绘制七彩的棕榈叶和裙摆旋转翻飞跳舞的女人。但他另一个系列的作品则要阴暗一些。黑色的背景加上深红色的圆盘和蓝紫色的色块对比鲜明。这三幅画其中一幅用蓝色和红色的笔触展示了一个眼含泪水,嘴巴因痛苦而大张着的非洲人面孔。这幅作品是他与镰刀型细胞贫血症长期以来不懈斗争的写照。

Hertz Nazaire关于镰刀型细胞贫血症的画作

Nazaire,43岁,美籍海地人,自童年起,他已经住院超过300次。像他一样的镰刀型细胞贫血症患者会告诉你,这种病最糟糕的部分是使人虚弱不堪的痛苦。

It's a horrifying thing to have, because it's extremely painful. It's a major fight all the time.
——Hertz Nazaire

一个世纪之前我们就了解到了镰刀型细胞贫血症的病因,该病因的遗传学起因是一种已经被充分研究过的单碱基基因突变。但医疗机构和制药行业长期以来一直没有针对这种疾病的有效疗法。

CRISPR/Cas9 技术的突破似乎为镰刀型细胞贫血症患者带来了希望。作为少数为镰刀型细胞贫血症寻求新疗法的基因编辑初创公司,CRISPR THERAPEUTICS正在利用基因编辑工具CRISPR解决这个医学难题。尽管早期的实验结果显示镰刀型细胞贫血症可以通过CRISPR技术根治,但是这项技术在人类身上使用还存在着担忧。

CRISPR Therapeutics 的网站封面截图 来源:http://crisprtx.com

2017年5月30日,一篇发表在期刊Nature Method名为《Unexpected mutations after CRISPR-Cas9 editing in vivo》的文章在科学界引起轩然大波,文章指出CRISPR-Cas9在体内可能存在广泛的脱靶效应并且引起了大量的基因突变。

虽然这篇文章随后被诸多学者指出存在问题,但是这篇文章却指出了CRISPR技术一直存在的弊端:Crispr-Cas9通常需要在细胞内引起基因组DNA双链断裂的过程,但这会造成基因组编辑位点的碱基随机插入或者删除等负面影响。同时,为了对基因位点进行修改,还需要引入外源基因片段作为模板通过同源重组修复断裂的DNA双链,也会造成编辑效率降低。

由此来看,在解决Nazaire的疾病(单碱基突变)方面,CRISPR技术可能存在潜在的问题:

  1. 在很多情况下,通过CRISPR技术对突变位点进行修复由于细胞状态和细胞类型的影响会造成编辑效率很低。

  2. 由于CRISPR需要引起DNA双链断裂,往往更加倾向于依赖NHEJ(Non-homologous end joining)过程进行断裂双链进行修复,所以非常容易造成编辑位点碱基随机插入和缺失。

研究统计结果表明,人类的遗传疾病中超过32,000种基因变化为单碱基突变。所以开发精确、高效、安全的基因编辑工具对单碱基突变进行修复有着重要的医疗应用价值。

人类的遗传疾病中超过32000中基因变化为单碱基突变

最近,新的基因编辑工具——DNA单碱基编辑成为人们关注的热点,这项技术有望在单碱基编辑上比目前CRISPR-Cas9编辑模式实现更高的编辑效率,并且安全性更高。这方面的工作主要由哈佛大学的David Liu研究团队完成。

从2016年到2017年,David Liu研究团队主要了开发了两种单碱基基因编辑工具。第一种可以将C·G碱基对转变为T·A碱基对,称为CBE(Cytidine Base Editing);第二种可以将A·T碱基对转变为G·C碱基对,称为ABE(Adenine Base Editing)

两种工具主要分为三种模块:

1. 脱氨酶模块:CBE和ABE的编辑原理均为碱基脱氨反应,相应的脱氨酶将编辑位点的碱基脱氨产生另一种碱基。

2. dCas9/Cas9 Nickase蛋白模块:通过结合Guide RNA(gRNA),将脱氨酶模块引导到基因组的编辑位点;

3. 效率增强模块:用于提高基因编辑效率,避免细胞修复机制影响编辑效果。

接下来我将两种工具的开发过程进行介绍。我们可以将不同的DNA单碱基编辑工具看成一个软件或者APP。每个软件都会经历版本更新,生物技术也是一样。每次对其修改都可以看成一次软件的更新。接下我们将按照APP更新的方式介绍ABE和CBE工具的开发过程。


01CBE(Cytidine Base Editing)

C·G碱基对转变为T·A碱基对


CBE (Cytidines base editor)编辑工具各模块概览

01

版本:CBE1

硬件构成:rAPOCBEC1-XTEN-dCas9

版本特性


研究人员开发了DNA单碱基编辑第一代工具:CBE1 (First generation of cytidines base editor).

CBE1可以对DNA碱基进行直接且不可逆的编辑,同时不需要DNA双链断裂,也不要提供额外的DNA Donor模板。研究人员将脱氨酶rat APOBEC1与dCas9蛋白融合,从而cytidine deaminase+dCas9可以在gRNA的引导下,对DNA的靶点碱基进行脱氨反应,将碱基C变成碱基U,从而实现DNA中C→T (或者G→A)的直接修改。

CBE的单碱基编辑过程

1.  碱基C的脱氨反应由cytidine deaminase催化,并且将碱基C变成碱基U,而碱基U可以在随后的复制过程中被DNA聚合酶识别为碱基T。

大多数已知的cytidine deaminase作用于单链RNA,还有一部分cytidine deaminase能够作用于DNA单链。而近期一些研究表明dCas9靶向DNA形成的RNA-DNA“R-Loop”复合体中至少存在9个碱基处于未配对状态(单链)。这使得dCas9结合的DNA(未配对部分)可以成为cytidine deaminase的作用底物,从而将DNA碱基C转变为碱基U(T)。

在实验中研究人员测试四种不同的cytidine deaminase enzymes (human AID, human APOBEC3G, rat APOBEC1, and lamprey CDA1)。实验表明,rat APOBEC1在体外实验中脱氨效率最高。随后研究人员将rat APOBEC1与dCas9蛋白的N端进行蛋白融合,并加上了XTEN linker(一种柔性氨基酸序列)。研究人员在体外检测了高效的、序列特异性的,依赖于gRNA的碱基编辑,这表明rat APOBEC1 + dCas9可以有效的将DNA序列上特定的碱基C转变为碱基U。故rAPOCBEC1-XTEN-dCas9成了CBE的第一代版本:CBE1。

2.  Editing Window:R-loop区内可以被CBE酶脱氨的位点数量称为Editing window。随着XTEN linker长度从3到21个氨基酸数量的增加,Editing window从3个碱基增加到6个碱基。但是随着linker的变化也会影响CBE酶的编辑效率。碱基编辑效率在linker为9个氨基酸的时候最高。而16个氨基酸长度的XTEN linker在这两点性质上可以提供一个很好的平衡点:有效的脱氨基editing window大约为5个碱基,编辑区域为Protopacer内的第4-8号位点(将距离PAM的远端作为第1号位点;gRNA结合在DNA上的位点一般为23个,靶向区共20个碱基,PAM区共三个碱基)。

02

版本:CBE2

硬件构成:rAPOCBEC1-XTEN-dCas9-UGI

本次更新:在dCas9 N端加入UGI (Uracil DNA glycosylase inhibitor)蛋白,解决CBE1在细胞内编辑效率下降的情况

版本特性


尽管CBE1可以在体外实现高效的编辑过程,但是细胞内各种各种的DNA修复机制可能对CBE1产生的U:G配对产物产生重要的影响。研究人员利用CBE1对人类细胞基因组6个已经广泛研究的位点中的14个C碱基进行的碱基编辑,尽管在这些位点研究人员检测到了碱基C变成碱基T的结果,但是碱基编辑的效率却降到了只有0.8%到7.7%左右,相比体外实验效率大约下降了5到36倍。

研究人员认为细胞内的DNA修复机制影响了碱基编辑的U:G配对产物,从而使得编辑效率大程度下降。Uracil DNA glycosylase (UDG)蛋白在细胞中催化U从DNA链上移除,并且启动碱基切除修复过程(base-excision repair, BER),通常修复的结果是将U:G碱基修复为C:G碱基。

所以可以在CBE1上加入一些可以影响UDG发挥作用的效应因子来抑制UDG发挥作用。Uracil DNA glycosylase inhibitor (UGI)是来自枯草芽孢杆菌噬菌体PBS1的含有83个残基的蛋白质,可以抑制UDG活性,从而提高CBE的单碱基编辑效率。

从而CBE第二代版本CBE2正式更新,在CBE1的基础上加入了UGI模块,以期解决CBE1在体内编辑效率大程度下降的情况。

CBE2 在人类细胞中的编辑效率相比CBE1提高了3倍,实验结果显示CBE1的编辑效率可以达到20%。

03

版本:CBE3

硬件构成:rAPOCBEC1-XTEN-Cas9 Nickase-UGI

本次更新:将dCas9换成了Cas9 Nickase,通过Cas9 Nickase将包含G的非编辑单链切断,进一步提高了CBE的编辑效率。

版本特性


利用CBE1或者CBE2进行碱基编辑的理论最高效率为50%。

所以为了进一步提高单碱基基因编辑的效率,研究人员将CBE1/2 中的dCas9模块更换成了Cas9 Nickase模块。Cas9 Nickase模块在dCas9的基础上,恢复了其在HNH结构域的催化碱基——His840。这样一来,Cas9 Nickase可以将包含G碱基的非编辑链(单链)切断。被切断的DNA链可以假扮成一条新合成的DNA单链,诱导MMR(Eukaryotic Mismatch Repair)过程;或者假扮成被破坏的DNA链,诱导BER(base-excision repair)过程。细胞内的修复机制可以将断裂的DNA链直接移除并且随后以完整链为模板合成新的DNA链。

新版本CBE3可以将C:G更高效变成U:A和T:A。在研究人员的实验中,CBE3的碱基编辑效率相对于CBE2提高了2-6倍,对靶点C的编辑效率大约为37%,而传统的Crispr/Cas9技术对相应位点的编辑效率只有0.5%。

更重要的是在CBE3编辑的实验中仅仅发生Indel(插入或者缺失)的概率只有1.1%,而传统的Crispr/Cas9技术引入Indel的概率则高达4.3%。

3S

版本:CBE3S

硬件构成:rAPOCBEC1-XTEN-Multiple Cas9 Nickase-UGI

本次更新:1. 将Cas9 Nickase更换成多种Cas9蛋白,让CBE可以识别更多的PAM序列,从而扩大CBE可以编辑的基因组位点。

2. 通过在脱氨酶模块引入突变,缩小了CBE的Editing Window,实现更加精确的碱基编辑,避免对靶点的无需编辑的碱基C进行编辑。

版本特性


BE3版本要实现有效的编辑需要在靠近PAM远末端中的protospacer序列的第4-8号位点中存在目标靶点碱基C。然而对于PAM NGG序列的要求限制了CBE可以编辑的基因组位点,因为大多数位点在靶点碱基C下游13-17个碱基的位置缺少PAM序列。

同时,CBE3能够将5个碱基的Editing Window里的全部碱基C编辑成碱基T,这样可能会导致本不需要被编辑的碱基C被编辑成T。

所以在新版本CBE3S中,重点解决CBE3中存在的以上两个主要问题。

1. 将Cas9 Nickase更换成多种Cas9蛋白,让CBE可以识别更多的PAM序列,从而扩大CBE可以编辑的基因组位点。

2. 通过在脱氨酶模块引入突变,缩小了CBE的Editing Window,实现更加精确的碱基编辑,避免对靶点的无需编辑的碱基C进行编辑。优化后的CBE版本的Editing window可以减小到2个碱基左右。


04

版本:CBE4(目前为止的最新CBE版本)

硬件构成:Gam-rAPOCBEC1-XTEN-Cas9 Nickase-UGI-UGI

本次更新:1.通过将UGI增加到两个拷贝,进一步增加了UDG蛋白接触碱基编辑位点的难度,提高了编辑产物的纯度。

2. 在CBE3的N端增加了Gam蛋白。Gam可以结合在DSB位点的末端,并且保护他们免于降解,从而有效的降低indel的出现概率。

版本特性


在CBE3, CBE3S版本发布的一年里,这项技术已经成功应用在了广泛的研究和生物体内。然而研究发现CBE编辑的产物中C·G碱基对不仅仅会被编辑成T·A,同时也会被被编辑成G·C或者A·T,这导致产物不纯,同时也影响了基因编辑的效率,在新版本CBE4中研究人员通过增加UGI拷贝数和加入Gam蛋白有效的减少了以上问题。

CBE4是目前为止最新且最成熟的C·G-T·A编辑版本。

1. 由于uracil DNA glycosylase (UDG)的存在,碱基编辑的结果往往会产生意外的结果,这种现象在编辑窗口中只存在一个碱基C时往往更加明显。限制UDG接触CBE3编辑产生的U:G中间体可以有效的提高编辑产物的纯度。所以研究人员通过将UGI增加到两个拷贝,进一步增加了UDG蛋白接触碱基编辑位点的难度,提高了编辑产物的纯度。

2. 大多数碱基编辑引起的Indel现象主要是由于 AP(apurinic or apyrimidinic site) lyase导致的。AP lyase是一种BER (Base-excision repair)酶,可以将无碱基位点转变成双链DNA断裂。因为CBE将包含G碱基的非编辑DNA单链切断(变成碱基U),由于UDG导致的糖苷键断裂将会造成AP位点,被AP Lyase识别从而断裂DNA双链,这个过程将会显著提高碱基插入或者删除的概率。而来自噬菌体Mu的蛋白质Gam可以结合在DSB位点的末端,并且保护他们免于降解。通过在CBE中加入Gam蛋白可以有效的降低indel的情况出现。


02ABE(Adenosine Base Editing)

A·T碱基对转变为G·C碱基对



ABE(Adenosine Base Editing)编辑工具各模块概览

ABE编辑工具与CEB的工作原理是相同,即均是利用碱基脱氨原理。

从理论上来说,腺嘌呤(A)脱氨后产生次黄嘌呤(I)。而碱基I可以被聚合酶识别并与碱基C配对,然后通过复制成为碱基G,进而实现碱基A·T编辑为碱基G·C。

尽管在理论上是可行的,但是至今没有发现任何酶能够催化DNA的腺苷脱氨过程(无论是单链还是双链)。已经报道的腺苷脱氨酶均作用在游离的腺嘌呤、腺苷或者RNA中的腺嘌呤等等。

虽然自然界中不存在相应的酶,但是没有什么是通过进化解决不了的所以研究人员就通过定向进化和蛋白质工程化改造技术对来自大肠杆菌的脱氨酶TadA进行改造,使之可以作用在DNA上,催化DNA的腺嘌呤脱氨过程。(脱氨酶TadA是大肠杆菌tRNA成熟修饰过程的一种脱氨酶,作用在RNA单链。)

研究人员开发了一套可以利用细菌对TadA酶进行进化的方法:修改抗生素抗性基因的关键位点,突变位点使得细菌抗生素抗性失效,而只有TadA酶作用于DNA并将突变位点修正后才能使得抗生素抗性基因恢复正常功能。通过这种方法,研究人员建立了TadA酶的突变文库。

ABE的进化一共进行了7轮。

以下是对进化过程比较关键的第1,2,5,7轮进化实验的信息汇总。

01

版本:ABE1 (1.1 1.2)

成熟版本:ABE 1.2

硬件构成:TadA*1–XTEN–Cas9 Nickase–NLS

版本特性


突变筛选发现A106V和D108N两个突变位点,其中TadA酶的突变位点D108使得TadA酶可以在DNA上发挥作用。将A106V 和D108N突变位点引入TadA酶,则CBE酶的第一代成熟版本CBE1.2诞生。将TadA*1–XTEN–nCas9–NLS作用于6个不同的基因组位点,结果显示A•T 转变为G•C的效率大约为3.2%左右。


02

版本:ABE2 (2.1 2.9 2.10)

成熟版本:ABE 2.10

硬件构成:TadA*2-TadA*2–XTEN–Cas9 Nickase–NLS

本次更新:1.TadA*2在TadA*1的基础上新增突变:D147Y,E155V 

2. TadA*2为二聚体

版本特性


TadA酶原本作为二聚体发挥作用,其中一个单体催化脱氨反应,而另一个单体作为tRNA的Docking Station。

所以ABE2版本将TadA*2恢复为二聚体,结果显示ABE编辑效率提高了5-9倍,编辑效率为20%左右。同时研究人员发现内部的TadA*2单体负责催化脱氨反应。


05

版本:ABE5 (3.1 4.3 5.1 5.3)

成熟版本:ABE 5.3

硬件构成:wtTadA-TadA*5–XTEN–Cas9 Nickase–NLS

本次更新:1. TadA*5在TadA*2的基础上新增突变:H36L,R51L,L84F,H123Y,S146C,I156F,K157N 

2. 将外部的TadA酶恢复为野生型wtTadA酶。

版本特性


1. 后续的突变位点对外部的TadA酶(docking station)活性产生影响,故将外部的TadA酶恢复为野生TadA酶,之后的突变位点只引入带了发挥作用的内部TadA酶中。

2. 并进一步提高了ABE的编辑效率ABE5.3对6个基因组位点的编辑效率为39%左右,

3. 解决了ABE存在的序列偏好性问题,提高了兼容性:对GAG序列编辑效率较低,最后ABE5.3的对不偏好位点(非YAC位点)的编辑效率也达到22-33%。


07

版本:ABE7 (6.3 6.4 7.4 7.8 7.9 7.10)

成熟版本:ABE 7.10(目前为止的最新的ABE版本)

硬件构成:wtTadA-TadA*7–XTEN–Cas9 Nickase–NLS

本次更新:1. TadA*7在TadA*5的基础上新增突变:W23R,P48A,R152P 

2.检验了近几轮进化的突变位点,重新对突变进行了组合并且再次引入了新的突变位点

版本特性


1. 利用DNA Shuffling对前6轮的突变位点进行了检验,移除了部分突变位点,消除了突变位点之间的负显位效应。并且通过第7轮进化引入了新的突变。

2. ABE7.10版本对6个基因组位点的平均编辑效率为58%左右,比ABE1.2 版本的编辑效率提高了29倍左右。

3. CBE7.10的Editing Window为4个氨基酸,编辑位点位于PAM远末端的第4到7号碱基。

4. 研究发现利用Cas9介导的HDR过程对相应碱基的编辑效率为0.47%到4.2%左右,并且Indel概率达到了3.3%到10.6%(48小时)。而利用ABE7.10,48小时后编辑效率为10-35%,120h小时后达到55-68%。同时更重要的ABE7.10的Indel概率降到了惊人了0.1%以下。这些研究都说明相比于CRISPR-Cas9技术,ABE7.10可以更加高效的在基因组相应位点引入A·T到G·C的突变。


03CBE & ABE 编辑技术的应用

解决人类的遗传疾病



接下来我将简要介绍一下David Liu开发的DNA单碱基编辑工具在疾病中的应用:

阿尔兹海默症


Apolopoprotein E基因为人类第19号染色体。研究发现其表达的蛋白第112位和158位的精氨酸是人类晚发阿尔兹海默症的常见遗传危险因子。研究发现Apolopoprotein E 蛋白的突变体APOE2(Cys112和Cys158),APOE3(Cys112和Arg158)与APOE3r (Arg112和Cys158)可以降低晚发阿尔兹海默症的发病风险。研究人员通过CBE编辑工具将158位Arg氨基酸改变为Cys氨基酸,编辑效率大约为58-75%。



p53基因突变相关癌症



p53基因为人类染色体的第17号染色体上。p53蛋白的突变Tyr163Cys与人类的多种癌症疾病发生相关。这项突变可以通过将C碱基变成T碱基来修复突变。研究人员利用CBE编辑工具对突变位点进行了修复。实验结果表明在HCC1954细胞中CBE的对突变位点的编辑效率为3.3-7.6%。虽然看起来效率比较低,但是通过传统的CRISPR/cas9的方法对突变位点进行编辑,竟然没有检测到任何的编辑能力,编辑效率小于0.1%,同时传统的CRISPR/cas9的方法还会导致靶点的Indel,Indel概率高达6.1-8.0%。



HFE基因突变·铁元素吸收紊乱



人类HFE基因为与第6号染色体上。基因组第845位的碱基G突变成碱基A,导致氨基酸C突变成氨基酸Y。这种突变会导致细胞对铁元素的过度吸收,可能会造成血清铁蛋白水平升高,威胁生命。研究人员利用CBE编辑工具对突变位点进行了修正,编辑效率为28%左右,并且在靶点没有发现Indel情况出现。

胎儿血红蛋白持续存在症



β球蛋白基因位于人类第11号染色体上。β球蛋白基因的突变可以导致多种血液疾病的产生。人类中一种较为罕见的遗传性状:胎儿血红蛋白持续存在症(HPFH,hereditary persistence of fetal hemoglobin)可以对包括镰刀型细胞贫血症在内的多种β球蛋白基因突变疾病产生抗性。研究表明,对HBG1HBG2的基因的启动子区域进行突变可以使得胎儿血红球蛋白的持续表达。研究人员通过ABE编辑工具,成功的在HEK293T细胞中HBG1和HBG2的基因的启动子区域进行了单碱基突变,编辑效率为29%和30%。

不仅仅是在以上几点研究中,在短短的一年里,研究人员已经利用DNA单碱基编辑工具在微生物、植物、动物等多种生物中进行了相应的应用,并且都取得了较好的编辑效果。


04CBE & ABE编辑技术的优势与劣势

DNA单碱基编辑技术远远还未成熟



最后我想谈一下DNA单碱基编辑技术的优势与劣势。

优势方面

首先相对于传统的CRISPR/Cas9方法,David Liu开发的DNA单碱基编辑工具包括ABE和CBE,对于基因组单碱基位点具有更高的编辑效率,并且编辑精确度,纯度更好。

同时由于不引入DNA双链断裂,DNA单碱基编辑工具对于Indel的引入概率更低。同时实验结果表明DNA单碱基编辑工具的脱靶效率更低。

劣势方面:

虽然DNA单碱基编辑工具的优势很大,但是毫无疑问这项技术还没有完全成熟,同时也存在很多劣势,这些劣势也有可能会限制其进一步广泛的应用。

1. PAM+Editing Window的限制


在前面的我已经介绍过,DNA单碱基编辑工具对基因组靶点进行编辑需要Cas9蛋白识别相应的PAM序列,同时不同版本ABE和CBE一般会在PAM序列上游的第13-17个碱基范围进行编辑(Editing Window在不同版本中一般会有~1-6个碱基)。

首先大多数位点在靶点碱基下游13-17个碱基的位置缺少PAM序列,虽然在CBE3S版本通过拓展Cas9模块,不同的Cas9蛋白增加了可以识别的PAM序列,但是仍然存在大量无法编辑的基因组位点。

同时对于Editing Window来说,很多人可能认为是越小越好,但我认为对于目前的DNA单碱基工具版本,越小并不代表越好。因为Editing Window越小,就越要求下游PAM的位点更加精确,而往往大多数实际情况是下游不存在PAM序列,从而大大的减少了可编辑的基因组位点。如果Editing Window的范围为4-6个碱基左右,则在PAM在一定程度出现的位置可以变得灵活一些。但是此时无论CBE和ABE对于Editing Window内的所有靶点碱基都会进行编辑。也就是说,Editing Window越大,靶点内包含C或者A碱基的概率会越大,那么可能本不需要编辑的C或者A碱基也会被编辑掉。

总之PAM + Editing Window的两个因素在一定程度了限制了DNA单碱基编辑工具的通用性,很多靶点不存在理想的PAM和Editing Window,从而不能被编辑。

2. 可编辑碱基对的限制


目前来说,DNA单碱基编辑工具CBE可以将C碱基编辑为T碱基,或者G碱基编辑为A碱基;ABE可以将A碱基编辑为G碱基,或者T碱基编辑为C碱基。

然而,正如下图所示,对于人类单碱基突变相关的疾病,除了C·G突变为T·A(占人类疾病48%)或者A·T突变为G·C(占人类疾病14%),还存在G·C突变为C·G(占人类疾病6%),T·A突变为A·T(占人类疾病7%),A·T突变为C·G(占人类疾病11%),C·G突变为A·T(占人类疾病15%)。所以目前来说,还存在38% 的碱基突变是目前的DNA单碱基编辑工具无法进行修复的。所以还需要进一步开发针对各种突变类型的单碱基编辑工具。

但是开发出多种工具的弊端带来的就是实际编辑过程的复杂性。假使我们需要对多种基因组靶点的多种碱基类型同时进行编辑,我们则需要不同种类的DNA单碱基编辑酶(ABE和CBE的多种版本来适配PAM和Editing Window)和不同种类的gRNA。多种工具同时发挥作用很有可能会造成编辑效率的降低,同时造成一些未知的负面效应(如脱靶或者引入indel概率增加)。而如果依次使用各种工具,一点一点的对多个靶点进行编辑则会浪费大量的时间和精力。所以开发出能够对基因组多靶点同时编辑的单碱基编辑系统也是一个需要攻克的难点。

同时针对其他碱基突变类型(非C·G到T·A和A·T到G·C)的单碱基编辑工具开发是否能够在原理上可行也是值得怀疑的。前文已经介绍到,ABE的原理在于Adenine脱氨后变成Inosine,而Inosine会被DNA聚合酶识别为Guanine;CBE的原理在于Cytosine脱氨后变成Uracil,而Uracil会被DNA聚合酶识别为Thymine。结构上的相似性导致碱基A与G,碱基C与T可以通过脱氨和DNA复制过程发生转换。但是其他的情况包括G·C转换C·G,T·A转换为A·T,A·T转换为C·G,C·G转换为A·T,由于碱基的结构差异,通过脱氨反应是无法实现转换的。

所以要实现所有碱基的相互转变,需要新的酶催化反应过程,但是目前尚不清楚是否能够实现。同时可能的思路我认为有一下几点:

  • 在自然界中搜寻相应的催化酶类或者通过进化或者蛋白质设计改造相应的酶对碱基进行编辑。利用的是新的酶催化反应实验不同碱基之间的相互转换。

  • 编辑的过程可能需要多种酶,进行多种反应。(但是可能多步反应会造成编辑效率低下)

  • 编辑的结果可能不是最终需要的碱基,但这种碱基可以被DNA聚合酶识别,通过DNA复制等过程变成最终所需要的碱基。


参考文献:

  1. Landrum, Melissa J., et al. "ClinVar: public archive of interpretations of clinically relevant variants." Nucleic acids research 44.D1 (2015): D862-D868.

  2. Sander, Jeffry D., and J. Keith Joung. "CRISPR-Cas systems for editing, regulating and targeting genomes." Nature biotechnology 32.4 (2014): 347-355.

  3. Komor, Alexis C., Ahmed H. Badran, and David R. Liu. "Editing the Genome Without Double-Stranded DNA Breaks." ACS Chemical Biology (2017).

  4. Hilton, Isaac B., and Charles A. Gersbach. "Enabling functional genomics with genome engineering." Genome research 25.10 (2015): 1442-1455.

  5. Komor, Alexis C., et al. "Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C: G-to-T: A base editors with higher efficiency and product purity." Science Advances 3.8 (2017): eaao4774.

  6. Rees, Holly A., et al. "Improving the DNA specificity and applicability of base editing through protein engineering and protein delivery." Nature Communications 8 (2017): ncomms15790.

  7. Kim, Y. Bill, et al. "Increasing the genome-targeting scope and precision of base editing with engineered Cas9-cytidine deaminase fusions." Nature Biotechnology 35.4 (2017): 371-376.

  8. Komor, Alexis C., et al. "Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage." Nature 533.7603 (2016): 420-424.

  9. Jiang, Fuguo, et al. "Structures of a CRISPR-Cas9 R-loop complex primed for DNA cleavage." Science 351.6275 (2016): 867-871.

  10. Cox, David Benjamin Turitz, Randall Jeffrey Platt, and Feng Zhang. "Therapeutic genome editing: prospects and challenges." Nature medicine 21.2 (2015): 121-131.

  11. Schaefer, Kellie A., et al. "Unexpected mutations after CRISPR-Cas9 editing in vivo." Nature methods 14.6 (2017): 547-548.



再创丨Regenesis

一个关于合成生物学的公众号

长按,识别二维码,加关注



    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存